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摘要 :作为 草地 资源 大 国 , 我 国正 面临 严峻 的 草场 退化 形势 。 和 擎 握 草 场 植 被 盖 度 的 历史 演变 趋势 ,是 草场 退化 驱动 力 识别 及 风 
险 评 佑 的 基础 。 目 前 已 有 研究 多 以 参数 回归 方法 估算 植被 盖 度 ,但 并 未 充分 考虑 其 苛刻 的 使 用 条 件 。 利 用 Landsat 系列 卫星 遥 
感 影像 及 地 面 植被 盖 度 监测 资料 建立 非 参数 回归 一 一 随机 森林 回归 模型 ,并 与 传统 线性 回归 方法 进行 比较 ,在 此 基础 上 应 用 随 
机 森林 回归 模型 估算 近 10 年 来 布尔 津 县 草场 植被 盖 度 的 变化 趋势 ,并 对 结果 的 不 确定 性 进行 分 析 。 结 果 显 示 :传统 的 线性 回 
归 方法 很 难 满 足 其 基本 的 统计 学 假设 条 件 ,而 随机 和 森林 模型 不 但 无 需 进 行 假设 条 件 检 验 ,而 县 预测 的 准确 性 也 优 于 以 往 普 遍 应 
用 的 线性 模型 。 基 于 Landsat ETM+ 标 准 数据 得 到 的 反 演 结果 较 之 TW 和 -OLI 数据 普遍 俩 小, 地 表 反 射 率 数据 虽然 可 以 大 幅 降 
低 传感器 不 同 对 反 演 结果 所 造成 的 影响 ,但 结果 仍 存在 约 上 10 狗 的 不 确定 性 。 涉 及 的 草场 类 型 众多 ,为 了 提高 反 演 精度 ,后续 研 
究 需 要 分 别 计算 其 植被 指数 ,并 尽量 减低 传 感 需 差异 带 来 的 不 确定 性 。 
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Abstract: As a large country with extensive grassland resources, China is facing severe grassland degradation. Studying 
trends in grassland vegetation cover change provides a basis for identifying the driving forces of grassland degradation and 
associated risk assessment. In previous studies, parametric regression models have typically been applied to estimate 
vegetation cover. However, the harsh assumptions of parametric regression have always been neglected. In the current study, 
vegetation cover monitoring data and vegetation indices ( NDVI, SAVI, MSAVI, EVI), extracted from Landsat remote 
sensing images, were used to build random forest regressions, which are non-parametric models. These models were 
subsequently compared with traditional linear regression models. To build and test these models, 205 samples were collected 
from 2010 to 2015 ( data from 2012 were not included) in alpine meadow, mountain meadow , lower-flat meadow, temperate 
meadow steppe, desert steppe, steppe desert, and desert in Burqin County, Xinjiang Uygur Autonomous Region. Among 
these samples, 150 samples were used to build models, and the remainder was used as testing data. Two sets of Landsat 


remote sensing images, Level 1 Standard Product and Surface Reflectance Product, were applied separately, and both 
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included TM data for 2011—2012 and OLI data for 2013—2015. In total, two random forest models and 23 linear models 
were built. The results indicated that the predictive ability of the random forest models was clearly stronger than that of most 
of the linear models. Moreover, it was not necessary to test the assumptions for the random forest models, whereas none of 
the linear models’ assumptions in this study could be satisfied perfectly. In the case study, random forest regression was 
applied to estimate the trend in grassland vegetation cover change in the last decade in the study area based on 663 sampling 
points. Among these, data for 2005—2009 were based on Landsat ETM+, data for 2010—2011 were based on Landsat TM, 
and data for 2013— 2015 were based on Landsat OLI. It was clear that sensor differences would have a certain influence on 
the inversion results. Therefore, we also simultaneously built a random forest model for MODIS-EVI data, as this would not 
be affected by sensor differences, and the results calculated using MODIS data were considered to be a standard. For Level 
] standard data, the results based on Landsat ETM+ were significantly smaller than the results based on MODIS. data. For 
surface reflectance data, the influence of different sensors on the results could be markedly reduced. Finally, to quantify the 
uncertainty of vegetation cover change trend based on surface reflectance data, we used a random forest model to verify 
vegetation cover extracted from different sensors during the same period, and found that the uncertainty was between -10% 
and 1196. In conclusion, random forest regression is assumed to be a better model to inverse vegetation cover than linear 
models. For its application in time series studies, Landsat surface reflectance production could significantly reduce the 
influence of sensor difference, although the uncertainty was still approximately 10946. In the current study, we assessed 
many grassland types, and to improve the accuracy of prediction, vegetation indexes should be calculated separately in 
further studies. In addition, efforts should be made to reduce the uncertainty associated with the data from different types of 


Sensor. 
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我 国 是 草地 资源 大 国 , 但 多 年 来 的 超载 过 牧 荒地 过 度 开 垦 和 滥 挖 乱 采 致使 草场 植被 覆盖 度 大 幅 下 降 , 水 
土 流 失 和 沙漠 化 日 趋 严重 ,牧区 经 济 发 展 及 草地 生态 系统 的 健康 因此 受到 了 严重 威胁 …。 研 究 草 场 变 化 规 
律 是 揭示 草场 退化 驱动 力 以 及 风险 评估 的 基础 ,在 缺乏 长 期 监测 数据 的 情况 下 ,借助 卫星 遥感 影像 不 失 为 有 
效 的 方法 。 当 前 可 用 的 遥感 数据 二 般 为 气象 卫星 NOAA 的 Ikm 分 辨 率 AVHRR 数据 一 ,terra 和 aqua 卫星 的 
250m 分 辨 率 MODIS Zia ^^ 和 陆地 卫星 Landsat 系列 数据 。 早 期 研究 多 采用 分 辨 率 较 低 的 AVHRR 数据 ， 
MODIS 数据 虽 具 有 和 较 高 的 完整 性 ,但 仍 难以 满足 长 时 间 序 列 研 究 的 需求 。Landsat 系列 卫星 自 1975 年 开始 已 
有 7 颗 卫 星相 继 运行 ,县 其 30m 的 分 辨 率 相 较 于 AVHRR 和 MODIS 来 说 优势 明显 ,因而 被 目前 不 少 研究 者 所 
关注 。 

利用 遥感 影像 研究 草场 变化 趋势 大 致 可 分 为 两 种 思路 ,其 一 是 通过 监督 或 非 监督 分 类 ,分 析 草 场 分 布 或 
面积 的 变化 1, 然而 面积 增 减 只 能 体现 宏观 变化 ,难以 反映 某 一 具体 区 域 在 时 间 序 列 上 的 退化 或 恢复 情况 ; 
其 二 是 利用 光谱 信息 计算 植被 指数 ,通过 植被 指数 变化 直接 表征 生态 系统 的 变化 趋势 ”" ,相对 而 言 ,这 类 方 
法 的 主要 优势 是 将 研究 对 象 精确 至 像 元 尺度 。 然 而 干旱 半 干 旱地 区 植被 盖 度 低 , 植 被 光谱 信息 弱 , 植 被 指数 
往往 非常 小 ,在 这 种 情况 下 用 其 变化 情况 说 明 草 场 生 态 的 改善 或 恶化 往往 意义 不 大 。 而 利用 植被 指数 反 演 植 
被 盖 度 不 失 为 一 种 可 行 的 替代 思路 。 植 被 盖 度 计算 主要 可 通过 线性 光谱 混合 模型 “和 回归 模型 两 种 方法 
实现 。 前 者 一 般 应 用 于 缺乏 地 面 监测 数据 的 情况 之 下 ,其 核心 是 获得 纯 像 元 下 的 地 物 光谱 值 。 但 在 实际 应 用 
中 ,特别 是 植被 盖 度 较 低 的 草地 生态 系统 中 ,典型 光谱 值 很 难 获得 , 且 计 算 误 差 较 大 “”!。 因 此 ,在 具备 地 面 监 
测 数 据 的 情况 下 ,一 般 通 过 植被 指数 与 植被 盖 度 直接 的 相关 关系 建立 参数 模型 , 反 演 植被 盖 度 ,其 中 线性 回归 
模型 应 用 最 为 广泛 。 然 而 以 往 的 研究 多 未 充分 考虑 参数 回归 苛刻 的 假设 条 件 , 以 及 多 元 回归 对 变量 间 
非 共 线性 的 要 求 ,这 无 疑 会 降低 反 演 模型 的 可 靠 性 。 解 决 此 问题 的 途径 之 一 是 寻求 预测 效果 达到 甚至 超越 参 
数 模型 的 非 参 数 方法 。 作 为 目前 预测 效果 最 好 的 非 参 数 回归 模型 之 一 ,随机 森林 模型 与 参数 回归 等 方法 相 
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EE ,无 需 对 变量 的 正 态 性 和 独立 性 等 假设 条 件 进行 检验 ,同时 也 不 需要 考虑 多 变量 的 共 线 问题 ,日 运算 高 
效 结果 准确 ,在 环境 以 及 生态 学 等 领域 都 有 着 广泛 应 用 PT 。 在 草场 研究 方面 ,随机 森林 虽 曾 用 于 植被 分 
2&7" ,但 作为 回归 模型 的 应 用 则 几 属 空白 。 

数据 源 是 保证 反 演 模型 可 靠 性 的 前 提 , 长 时 间 序 列 研 究 会 不 可 避免 地 使 用 到 来 自 不 同 传感器 的 光谱 信 
A, ,而 对 于 Landsat 系列 卫星 标准 数据 产品 而 言 , 同 一 时 间 段 内 从 不 同 传感器 所 提取 的 光谱 信息 会 存在 一 定 差 
异 ,需要 对 非 同 源 数据 进行 校正 以 及 标准 化 处 理 ” 。 但 目前 草场 方面 已 有 的 研究 既 没 有 定量 分 析 传 感 器 
差异 对 反 演 结果 造成 的 影响 ,也 没有 计算 校正 和 标准 化 处 理 对 反 演 结果 的 改进 效果 。 

鉴 此 ,本 文 利 用 Landsat 系列 卫星 TM,ETM+ 以 及 OLI 的 影像 和 植被 盖 度 地 面 监 测 数据 建立 基于 随机 森林 
回归 的 草场 植被 盖 度 反 演 模型 ,并 将 反 演 结果 与 线性 回归 结果 进行 比 对 ,探讨 其 优越 性 。 继 之 将 其 应 用 于 基 
于 多 源 数据 的 草场 植被 盖 度 变化 趋势 分 析 ,并 探讨 该 方法 的 不 确定 性 ,以 期 为 干旱 半 干 旱地 区 长 时 间 施 列 的 
草场 变化 研究 提供 方法 支持 。 


1 研究 区 域 


布尔 津 县 位 于 新 疆 西 北部 阿勒泰 地 区 , 属 阿 尔 泰 山脉 西南 乱 , 介 于 86?25'—88*6'E,47?22'—49?1I'N Ż 
间 ,总 面积 10369km 。 境 内 景观 异 质 性 强 ,北部 山区 最 高 蜂 海拔 4374mi, 中 部 为 低 山 丘陵、 河谷 地 带 ,南部 为 
低 平 戈壁 滩 ,海拔 最 低 处 仅 为 436m( 图 1) 。 全 县 生态 系统 多 样 ,北部 山区 兼 具 水 源 涵养 与 生物 多 样 性 保护 的 
功能 ,南部 车 漠 生态 系统 肩负 防风 固沙 的 生态 功能 。 草 地 资源 丰富 ,各 类 草地 类 型 均 有 分 布 ,农业 以 畜牧 为 
主 , 放 牧 方式 仍 属 传统 游牧 。 当 前 北部 林 区 载 冀 量 快速 增加 , 林 牧 这 盾 突 出 ,南部 以 车 漠 植 被 为 主 , 生 态 环境 
脆弱 ,生态 保护 形势 更 加 严峻 。 丰 富 而 多 样 的 草场 分 布 特征 ,不 仅 可 使 草场 植被 盖 度 反 演 模型 为 分 析 当 地 草 
场 历史 变 化 趋势 乃至 制定 草场 保护 和 冀 牧 业 生产 政策 攀 定 基础 ;同时 也 可 为 其 他 地 区 的 各 类 草场 研究 提供 一 
定 借鉴 。 


2 数据 获取 与 预 处 理 


为 了 建立 基于 随机 和 森林 回归 的 草场 植被 盖 度 反 演 模型 ,本文 所 用 之 数据 主要 包括 基于 地 面 调查 的 草场 盖 
度数 据 和 卫星 遥感 影像 。 

植被 盖 度 地 面 调查 数据 来 源 于 布尔 津 县 畜牧 兽医 局 草原 站 提供 的 2010、2011、2013、2014、2015 年 6 一 
9 月 的 草本 、 半 灌木 及 矮小 灌木 草原 样 方 调查 表 。 调 查 样 地 涵盖 全 县 8 个 典型 草场 类 型 , 即 低 平 地 草 甸 高寒 
草 僻 、 山 地 草 馈 、 温 性 草 馈 草原 、 温 性 草原 化 荡 漠 \ 温 性 况 江 以 及 温 性 充 江 草原。 依据 典型 性 原则 , 样 方 在 能 够 
代表 整个 样 地 草原 植被 地形 及 土壤 等 特征 的 区 域 随机 布设 ,监测 样 地 共计 205 个 ,分 布 及 类 型 如 图 1 所 示 ， 
每 个 样 地 设置 3 个 样 方 , 样 方 大 小 为 1mx1m ,监测 结果 用 3 个 样 方 的 平均 值 表示 。 部 分 监测 点 位 虽然 超越 了 
县 界 , 但 并 未 超越 本 文 所 用 的 遥感 影像 范围 ,因此 本 文 将 此 类 监测 点 也 纳入 分 析 范 围 。 植 被 盖 度 是 由 日 测 法 
测定 的 样 广 内 植物 地 上 部 分 垂直 投影 面积 占 样 方面 积 的 比率 ,监测 频次 为 每 年 一 次 。 

遥感 数据 为 下 载 目 美 国 地 质 调查 局 (U.S. Geological Survey ) 网 站 (http ://glovis.usgs.gov/) 的 Landsat 系列 
卫星 遥感 影像 ,整个 县 域 需 要 两 景 影像 履 次 , 行 带 号 分 别 为 144/26 144/27 ,影像 时 间 及 传 感 厅 信息 如 表 1 
所 并。 

本 文 所 使 用 的 每 一 景 影像 都 包含 有 目前 此 类 研究 通用 的 一 级 标准 数据 产品 (简称 L1 数据 ) 以 及 经 过 校 
正和 标准 化 处 理 的 地 表 反 射 率 数 据 产 品 (简称 SR 数据 ) ,用 以 定量 研究 传 感 带 差异 对 反 演 结果 的 影响 。 

本 文 的 研究 对 象 为 草场 ,因此 需要 对 影像 进行 监督 分 类 ,提取 出 草场 范围 。 首 先 , 利 用 ENVI 5.1 软件 对 
2015 年 Landsat8 OLI 的 两 景 Ll 影像 (144/27、144/27) PAJETE HATER .融合 以 及 FLAASH 大 气 校正 
等 预 处 理 。 其 次 初步 将 影像 定义 为 林地 草地、 忒 地 水体. 冰雪 区 五 大 类 型 ,分别 划 定 训练 样本 ,通过 最 大 似 
然 去 进行 分 类 。 经 过 分 类 后 处 理 , 以 GoogleEarthPro. 的 高 分 辩 率 影像 为 基础 , 划 定 验证 样本 ,通过 混 肴 和 矩阵 
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计算 分 类 精度 。 两 景 影像 (144/27、144/27) 的 总 体 分 
类 精度 分 别 为 97.7705% 和 98.874996 ,Kappa 系数 分 别 
为 0.9692 和 0.9642。 合 并 草地 于 地 两 种 类 型 的 区 域 ， 
通过 目 视 解 译 去 除 其 中 的 耕地 和 建设 用 地 区 域 ,得 到 布 
尔 津 县 草场 分 布 范围 (图 2) 。 


3 研究 方法 


3.1 随机 森林 模型 的 建立 与 验证 
3.1.1 植被 指数 选择 

归 一 化 植被 指数 (NDVI) 是 草场 退化 研究 中 使 用 最 
为 广泛 的 植被 指数 “1, 本文 首 先 选择 其 作为 模型 的 
解释 变量 之 一 。 由 于 研究 区 南部 大 片区 域 为 植被 盖 度 
较 低 的 温 性 草原 化 范 漠 、 温 性 亮 漠 以 及 温 性 鞠 漠 草原， 
仅 使 用 NDVI 作为 解释 变量 , 反 演 效果 可 能 并 不 能 达到 
预期 ,必须 考虑 土壤 背景 的 影响 ,因此 进一步 引入 可 
用 于 修正 土壤 背景 敏感 性 以 及 气 溶胶 散射 影响 三 个 植 
被 指数 一 一 土壤 调 市 植被 指数 (SAVI) 、 修正 土壤 调节 
植被 指数 ( MSAVI) .增强 植被 指数 (EVI) 。 上 述 植被 指 
数 的 计算 方法 如 式 1 一 式 4 所 示 , 其 中 参数 的 选取 依据 
了 USGS 发 布 的 植被 指数 产品 相关 指南 1 。 


o (1) 
NIR-RED 


NIR-RED 


SAVI- x 
NIR+RED+0.5 


1.5 


(2) 


MSAVI= (2xNIR*1-./(2xNIR*1)^-8x( NIR-RED ) X0.5 


(3) 
NIR-RED (4) 


EVI-2.5x 
NIR*6xRED-7.5xBLUE-*1 


3.1.2 ”模型 建立 

图 1 中 监测 点 位 的 植被 盖 度 数据 分 别 来 自 2010、 
2011.2013、 2014 .2015 年 -6 一 9 H ,经 统计 分 析 , 在 6 一 9 
月 期 间 ; 植 被 盖 度 并 无 显著 区 别 ,因此 在 对 应 年 份 的 
6 一 9 月 中 选择 云 量 最 少 的 影像 加 以 利用 , 即 利 用 
2010 一 201T 年 8 月 的 TM 影像 和 2013—2015 年 7 月 的 
OLL 影 像 计 算 相 应 点 位 的 4 个 植被 指数 。 

利用 R 软件 在 205 组 数 数据 (植被 盖 度 及 其 对 应 
植被 指数 ) 中 随机 抽取 150 组 作为 训练 数据 用 于 模型 
建立 。 


表 1 遥感 影像 信息 列表 


Table 1 Information of satellite images 


影像 时 间 

Image dates 
2016-08 
2015-07 
2014-07 
2013-07 
2011-08 
2010-08 
2009-08 
2008-08 
2007-08 
2006- 07 
2005-08 


行政 边界 


49?N 


传感器 信息 
Information of sensors 
Landsat8 OLI Landsat7 ETM+ 
Landsat8 OLI Landsat7 ETM+ 
Landsat8 OLI 
Landsat8 OLI 
Landsat4-5 TM 
Landsat4-5 TM 
Landsat4-5 TM Landsat ETM+ 
Landsat7 ETM+ 
Landsat7 ETM+ 
Landsaty ETM+ 
Landsat7 ETM+ 


87° 88°E 


高 : 4374m 

| AR: 436m 
草地 类 型 
e 低 平 地 草 甸 
A 山地 草 甸 
目 温 性 草原 
* 温 性 草原 化 荒漠 
^ 温 性 草 甸 草 原 
+ 温 性 荒漠 
* 温 性 荒漠 草原 
@ AREA 


48? 


47° 


图 1 研究 区 地 形 及 监测 点 位 分 布 图 


Fig.1 Elevation and monitoring points’ distribution of study area 


随机 和 森林 是 由 多 棵 相互 没有 关联 的 决策 树 组 成 的 集成 决策 树 , 用 |h(X,Bk) , k 1, c 表示, 其 中 站 为 
输入 向 量 ,| Bk| 为 独立 同 分 布 随机 向 量 ” 。 与 经 典 回 顾 分 析 类 似 ,随机 森林 可 以 解释 多 个 自 变 量 (X, 、X,… 
X, ) 对 因 变 量 了 的 作用 。 此 处 将 植被 盖 度 的 实地 监测 值 作为 因 变 量 Y,NDVI、SAVI、MSAVI I EVI 作为 日 变 
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量 。 随 机 森林 模型 的 建立 通过 调用 R 话 言 中 
“randomForests” 程序 包 ”来 实现 。 该 方法 首先 完成 两 
个 随机 采样 过 程 , 即 通过 自助 法 重 采样 技术 有 放 回 的 在 
150 组 训练 数据 中 重复 随机 抽取 150 个 训练 样本 ,未 被 
抽取 到 的 数据 被 称 为 “ 袋 外 ”( out of bag) 数据 。 再 从 
NDVI SAVI, MSAVI 和 EVI 的 4 个 变量 中 随机 选择 若 
干 个 变量 (以 m, RR ) 建立 决策 树 ,模型 中 m, BE k 
值 一 般 为 总 变量 的 1/3 ,本 文 有 4 个 变量 , 则 m, EN 1s 
最 后 重复 n 次 上 述 过 程 ,生成 由 棵 决策 树 组 成 的 随机 
AM, n 值 越 大 预测 越 好 。 随 着 n 值 的 增 大 , 代 外 数据 
误差 在 显著 降低 后 会 基本 保持 稳定 。 为 了 节省 计算 时 
间 ,n 值 保 证 袋 外 数据 误差 稳定 即 可 ,本 文 n 值 取 150, 

模型 输出 所 有 决策 树 计算 结果 的 均值 ,并 通过 计算 
“解释 方差 百分比 ?来 评定 模型 预测 能 力 。 对 于 各 个 上 自 
变量 对 因 变 量 的 影响 程度 ,用 方差 增 量 以 及 节点 纯度 增 
量 两 个 指标 来 定性 表征 。 前 者 指 将 某 一 变量 替换 成 随 
机 变量 后 对 预测 结果 造成 的 影响 , 若 用 于 替换 的 随机 变 图 2 草场 范围 及 抽样 点 分 布 图 
ut 显著 改变 了 方差 , 则 认 为 原 恋 m 重 要 性 很 高 后 KH 从 Fig.2 Distribution of grassland and sampling points in study 
同 质 性 增加 的 角度 去 表征 变量 的 重要 性 23 。 随 机 森林 、 
模型 的 具体 算法 请 参照 Biau 等 “的 文章 。 

为 了 将 随机 森林 回归 方法 与 传统 的 线性 回归 进行 比较 ,本 文采 用 同样 的 训练 数据 同时 建立 了 植被 盖 度 与 
NDVI,SAVI,MSAVI 和 EVI 的 一 元 线性 回归 及 多 元 线性 回归 模型 。 
3.1.3 ”模型 验证 

利用 205 组 数据 经 过 随机 抽样 剩余 的 :55 组 数据 用 于 模型 验证 。 应 用 前 文 建立 的 随机 森林 模型 和 各 个 线 
性 回归 模型 分 别 计算 55 个 点 位 的 植被 盖 度 预测 值 ,并 将 实测 值 与 预测 值 相 减 ,根据 差 值 分 布 情况 比较 模型 的 
预测 能 力 。 此 外 ,通过 绘制 残 差 散 点 图 和 正 态 Q-Q 图 来 检验 线性 回归 模型 方差 齐 性 以 及 残 差 的 正 态 性 ,并 通 
过 Kappa 系数 来 判断 变量 的 共 线 性 。 
3.2 ”模型 的 应 用 及 其 不 确定 性 分 析 
3.2.1 模型 应 用 

利用 AreMap 10 软件 在 研究 区 域内 随机 生成 1000 个 相互 间隔 大 于 1km 的 点 位 ,去 除草 场 范围 之 外 的 点 
位 ,得 到 草场 抽样 点 。 为 了 人 研究 模型 在 基于 多 源 数 据 的 植被 盖 度 反 演 领域 的 应 用 ,本 研究 以 2005—2008 年 
ETM+ 影 像 \2009 一 2011 年 TM 影像 .2013 一 2015 年 OLI 影像 为 基础 ,分 析 2005—2015 年 间 ( 除 2012 4E.) , 植 
被 盖 度 的 变化 趋势 。 

首先 , 噜 除 研究 时 段 内 落 在 云层 和 云 影 中 的 草场 抽样 点 ,最 终 得 到 的 356 个 点 位 用 于 本 小 节 的 抽样 分 析 
(图 2)。 其 次 ,分 别 利 用 上 述 影像 的 LI1 和 SR 数据 计算 各 个 点 位 的 NDVI、SAVI、MSAVI 和 EVI 值 ,将 其 输入 
3.1 中 建立 的 随机 森林 模型 ,分别 得 到 监测 点 位 基于 L1 数据 和 SR 数据 的 植被 盖 度 值 。 最 后 ,将 每 年 356 个 
监测 点 位 的 植被 盖 度 预测 值 求 平均 ,绘制 出 基于 Ll 数据 和 SR 数据 的 植被 盖 度 变化 趋势 图 。 
3.2.2 不 确定 性 分 析 

由 于 2005—2015 年 间 遥 感 影像 源 自 3 个 不 同 的 传感器 ,而 传感器 的 差异 会 给 反 演 结果 带 来 一 定 影响 ， 
此 本 人 研究 进一步 应 用 下 载 自 美国 地 质 调查 局 地 球 资 源 观 察 和 科学 中 心 (Earth Resources Observation and 
Science Center) 的 MODIS 一 MOD13Q1 V005 数据 集 建立 随机 森林 模型 , 反 演 2005—2015 年 的 植被 盖 度 。 由 于 
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MODIS 数据 不 存在 传感器 差异 问题 ,因此 可 将 基于 此 数据 反 演 出 的 植被 盖 度 变化 趋势 作为 参考 ,将 3.2.1 中 
得 到 的 基于 Ll 和 SR 数据 的 趋势 曲线 与 之 相 比 较 , 变 化 趋势 越 接 近 基 于 MODIS 数据 的 反 演 结果 , 则 说 明 该 数 
据 中 不 同 传 感 硕 给 反 演 结果 造成 的 误差 越 小 。 

前 文 提 到 SR 数据 是 L1 数据 经 过 校正 和 标准 化 处 理 的 地 表 反 射 率 数据 产品 ,可 在 一 定 程 度 上 克服 传 感 
器 的 差异 对 结果 人 带 来 的 影响 。 为 了 定量 分 析 SR 数据 对 反 演 结果 的 改进 效果 及 不 确定 性 ,本 人 研究 进一步 比 对 
同一 时 期 内 ,基于 不 同 传感器 的 反 演 结果 之 间 存 在 的 差异 。 

人 研究 区 范围 草场 生长 期 内 ,同时 具有 TM 和 ETM+ 影 像 的 时 段 是 2009 年 8 月 ,同时 具有 ETM+ 和 'OEL 影 像 
的 时 段 是 2015 年 7 月 和 2016 年 8 月。 在 草场 抽样 点 中 去 除 09、15、16 年 3 年 内 云层 、 云 影 中 的 点 位 以 及 
ETM+ 数 据 中 坏 条 带 中 的 点 位 后 ,剩余 663 个 点 位 用 于 不 确定 分 析 。 利 用 随机 森林 模型 分 别 计算 同一 时 段 基 
于 不 同 传感器 的 反 演 结果 并 相 减 ,分 别 绘制 基于 LI1 数据 和 SR 数据 的 TM 一 ETM+ .OLI 一 ETM+ 的 盖 度 到 演 结 
果 差 异 概 率 密度 图 。 


4 结果 与 讨论 


41 拟 合 结果 

随机 森林 模型 的 计算 结果 显示 ,基于 Ll 数据 和 SR 数据 而 建立 的 随机 森林 回归 模型 输出 的 解释 方差 百 
分 比分 别 为 69.82% 和 72.42% ,因此 后 者 的 预测 效果 优 于 前 者 ;重要 性 方面 ,各 个 植被 指数 并 未 表现 出 明显 的 
差别 ( 表 2)。 


表 2 随机 森林 回归 模型 变量 重要 性 


Table 2 The variables’ importance in random forest models 


一 级 标准 数据 产品 地 表 反 射 率 数 据 产品 
Levell standard data product Surface reflectance data products 

zh EL 

XE > M Ex ER: M Ex > M Ex RI UN 
o 方差 增 量 节点 纯度 增 量 方差 增 量 节点 纯度 增 量 

Increase in mean Increase in node Increase in mean Increase in node 
squared error purity squared error purity 

NDVI 12.927 35899.58 9.119 27067.63 

SAVI 10.777 31475.49 9.080 29956.79 
MSAVI 11.111 38354.48 7.008 23012.77 

EVI — = 7.837 26277.86 


由 于 LI 数据 未 经 过 标准 化 处 理 ,TM 和 OLI 数据 计算 的 EVI 值 不 在 同一 数量 级 ,无 法 用 于 模型 的 建立 ;NDVI: 归 一 化 植被 指数 ,Normalized 
Difference Vegetation Index; SAVI; ERJA 15 fH 8X F5 X, Soil Adjusted Vegetation Index; MSAVI: 修正 土壤 调节 植被 指数 ,Modified Soil Adjusted 
Vegetation Index ; EVI ; 2558 FEL 8482 , Enhanced Vegetation Index 


本 研究 一 其 建立 线性 回归 模型 23 个 ,其 中 尸 值 显著 的 模型 及 相应 参数 如 表 3 所 示 。 由 表 3 可 知 ,对 于 一 
元 线性 回归 模型 来 说 L1 数据 和 SR 数据 的 玉 差 别 不 大 ;对 于 多 元 回归 来 说 所 有 的 L1 数据 都 无 法 得 到 显著 结 
果 ; 从 玉 的 数值 上 来 看 SR 数据 的 多 元 回归 的 效果 要 明显 优 于 一 元 回归 。 
4.2、 模 型 比较 

为 了 进一步 分 析 上 述 模型 的 预测 能 力 ,本 文 将 55 个 验证 点 位 的 监测 值 和 预测 值 作 差 ,结果 的 分 布 情况 如 
图 3 所 示 。 首 先 , 虽 然 Ll 和 SR 数据 的 一 元 回归 效果 在 表 3 中 无 法 通过 RR 判断 ,但 通过 比较 红色 和 绿色 箱 线 
图 可 明显 看 出 ,SR 数据 实测 值 和 预测 值 的 差异 明显 小 于 Ll 数据 ;第 二 ,随机 森林 回归 模型 的 预测 能 力 略 优 于 
多 元 回归 模型 ,上 且 这 两 者 明显 优 于 一 元 线性 回归 ;第 三 ,所 有 线性 回归 的 结果 较真 实 值 来 说 普遍 偏 小 ,但 随机 
森林 的 预测 偏差 相对 均衡 。 

在 本 文 所 建立 的 所 有 模型 中 ,预测 效果 最 好 的 是 基于 Ll 和 SR 数据 的 随机 森林 模型 ,以 及 由 变量 SAVI- 
MSAVI 建立 的 SR 数据 二 元 回归 模型 。 
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表 3 线性 回归 模型 结果 


Table 3 The results of linear models 


一 级 标准 数据 产品 地 表 反 射 率 数 据 产品 
E n 
EOM Levell standard data product Surface reflectance data products 
Models arae å n å n 
值 Value P R? 值 Value P R? 
EVI 常量 Constant = 25.13 «0.001 0.65 
系数 Parameter 0.01 «0.001 
NDVI 常量 Constant 32.49 «0.001 0.68 20.54 «0.001 0.73 
系数 Parameter 124.42 «0.001 0.01 «0.001 
SAVI 常量 Constant 32.49 «0.001 0.68 22.46 «0.001 0.69 
系数 Parameter 83.07 «0.001 0.01 «0.001 
MSAVI 常量 Constant 32.4 «0.001 0.66 26.55 «0.001 0.64 
系数 Parameter 85.60 «0.001 0.01 «0.001 
SAVI-MSAVI 常量 Constant 不 显著 9.63 <0.001 0.77 
系数 1 Parameterl 0.08 «0.001 
quum 系数 2 Parameter2 -0.00 <0.001 
> SAVI+EVI 常量 Constant 不 显著 17.94 <0.001 0.73 
©) 系数 1 Parameterl 0.05 «0.001 
N 系数 2 Parameter2 —0.04 «0.001 
-一 NDVI+SAVI+EVI 常量 Constant 不 显著 17.93 <0.001 0.74 
O 系数 1 Parameterl 0.01 «0.05 
[| 
er 系数 2 Parameter2 0.03 «0.05 
O 系数 3 Parameter3 -0.02 <0.05 
o9 ECT LL 标准化 处 再.TM 和 0 数据 计算 的 TVT 值 不 在 同一 数量 级 无 沁 用 于 模型 的 建立 
um 
( x | 40 o o 
B B o 6 8 o 
> 4^ cq CT 8 - sr ES 
an | | : 
| x | | | 
E | | | | : | 
Ü | | 
A ! i i H r f ! 
RE I I LL 


NDVILI SAVILI MSAVILI NDVISR SAVISR MSAVISR EVISR SRSM SRSE SRNSE rfL1 rfSR 


图 3 植被 盖 度 的 实测 值 与 预测 值 差 异 
Fig.3 The difference between monitoring values and predicted values 

NDVILI :基于 ,LI 数据 NDVI 指数 的 线性 回归 模型 Linear model based on NDVI from level 1 standard produet;SAVIL1: 基 于 L1 数据 SAVI 指数 
的 线性 回归 模型 , Linear model based on SAVI from level 1 standard product; MSAVIL1: 基 于 L1 数据 MSAVI 指数 的 线性 回归 模型 Linear model 
based on MSAVI from level 1 standard product; NDVISR :基于 SR 数据 NDVI 指数 的 线性 回归 模型 , Linear model based on NDVI from surface 
reflectance product; SAVISR :基于 SR 数据 SAVI 指数 的 线性 回归 模型 ,Linear model based on SAVI from surface reflectance product ; MSAVISR : 基 
于 SR 数据 MSAVI 指数 的 线性 回归 模型 ,Linear model based on MSAVI from surface reflectance product; EVISR :基于 SR 数据 EVI 指数 的 线性 
回归 模型 ,Linear model based on EVI from surface reflectance product; SRSM :基于 SR 数据 SAVI 及 MSAVI 指数 的 线性 回归 模型 , Linear. model 
based on SAVI and MSAVI from surface reflectance product;SRSE :基于 SR 数据 SAVI 及 EVI 指数 的 线性 回归 模型 ,Linear model based on SAVI 
and EVI from surface reflectance product; SRNSE :基于 SR 数据 NDVI SAVI 及 EVI 指数 的 线性 回归 模型 Linear model based on NDVI,SAVI and 
EVI from surface reflectance product; rfL1 :基于 L1 数据 的 随机 森林 回归 模型 , Random forest model based on level 1 standard product;rfSR: 基 于 
SR 数据 的 随机 森林 回归 模型 ,Random forest model based on surface reflectance product 
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图 4 H SRSM 方差 齐 性 和 残 差 正 态 性 检验 结果 。 理 想 状 态 下 , 残 差 - 拟 合 值 关 系 图 上 的 点 应 随机 分 布 , 而 
正 态 QQ 图 中 的 点 应 分 布 于 虚线 之 上 ,但 SRSM 模型 并 不 能 满足 其 基本 假设 条 件 ,特别 是 残 差 的 正 态 分 布 性 。 
不 仅 如 此 ,本 研究 所 有 其 他 的 线性 回归 模型 也 都 不 能 很 好 的 满足 其 基本 假设 。 此 外 ,SRSM 的 各 变量 应 满足 
非 共 线性 , 即 Kappa 值 小 于 100 ,但 经 过 计算 该 模型 的 Kappa 值 高 达 5570。 从 对 模型 的 诊断 结果 看 ,SRSM 模 
型 虽然 预测 效果 较 好 ,但 应 用 于 植被 盖 度 的 反 演 存在 较 大 的 缺陷 。 


JE Residuals 


30 40 50 60 70 80 90 
拟 合 值 Fitted values 


准 化 残 差 Standardized residuals 


标 


-2 -1 0 l 2 
理论 分 位 数 Theoretical quantiles 


图 4 SRSM 模型 的 假设 检验 
Fig.4 Hypotheses testing of SRSM model 
SRSM: 基 于 SR 数据 SAVI 及 MSAVI 指数 的 线性 回归 模型 ,Linear model based on SAVI and MSAVI from surface reflectance product 


综 上 ,本 文 认为 随机 森林 模型 相 较 于 线性 回归 模型 来 说 不 但 不 受 诸多 假设 条 件 和 非 共 线 性 要 求 的 制约 ， 


并 能 达到 更 好 的 预测 效果 ,因此 更 适合 作为 植被 盖 度 的 反 演 模型 。 
4.3 2005—2015 年 草场 植被 盖 度 变化 趋势 及 不 确定 性 分 析 go 


基于 L1 SR 以 及 MODIS 数据 分 别 得 到 的 草场 盖 度 
平均 值 变 化 趋势 如 图 5 所 示 。 除 /2006 年 之 外 ,SR 和 Ll 
数据 反 演 得 到 的 植被 盖 度 变化 情况 基本 保持 了 一 致 的 
变化 趋势 ,但 2005— 2009 年 ,也 即 数据 源 为 ETM+ 的 时 
间 段 内 ,基于 Ll 的 反 演 结果 要 明显 小 于 SR 数据 的 反 
演 结果 。SR 数据 与 不 存在 传 感 硕 差异 问题 的 MODIS 
数据 反 演 所 得 的 植被 盖 度 值 相 比 ,差异 小 于 5% ,但 L1 
数据 的 偏差 较 大 ,ETM+ 数 据 的 预测 结果 普遍 偏 小 ,2006 
年 的 植被 盖 度 均值 其 至 偏 小 超过 20% 。 

为 了 分 析 传 感 需 差 异 给 反 演 结果 造成 的 影响 ,本文 
进一步 对 比 子 同一 时 期 内 源 自 不 同 传感器 光谱 信息 反 
演 得 到 的 植被 盖 度 ,对 比 结 果 如 图 6 所 示 。 该 图 显示 了 
2009 年 ETM+ 数 据 与 TM 数据 ,以 及 2015—2016 年 
ETM+ 数 据 与 OLI 数据 分 别 反 演 得 到 的 植被 盖 度 的 
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图 5 基于 MODIS、SR X L1 数据 的 抽样 点 盖 度 平均 值 
Fig.5 Mean vegetation cover of sampling points based on 
MODIS, SR and L1 data L1; 一 级 标准 数据 产品 Levell Standard 
Data Product; SR; 经 过 校正 和 标准 化 处 理 的 地 表 反 射 率 数据 产品 


Surface Reflectance Data Products , 


由 图 6 的 概率 密度 曲线 可 知 ,同一 时 段 L1 数据 不 同 传 感 带 对 计算 结果 差异 巨大 ,特别 是 ETM+ 数 据 的 预 
测 结果 普遍 小 于 TM 数据 ,上 述 结果 与 图 5 的 结论 一 致 。 从 具体 计算 的 数值 来 看 :对 于 SR 数据 ,几乎 90% 的 
测试 点 位 上 不 同 传 感 副 对 计算 结 来 产生 的 影响 都 能 落 在 (-10%,11%) 的 区 间 之 中 ;但 对 于 L1 数据 ,90% 测 试 
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点 位 的 ETM+ 与 OLI 的 差异 落 在 (-30% ,11% ) 范围 内 ， 


0.15 SRrfETM TM 

而 ETM+ 与 TM 的 差异 更 是 落 在 了 (-40% ,9%) 之 中 。 | | 
= Lir E 

由 此 可 见 ,不 同 传 感 希 的 差异 在 LI 数据 上 表现 的 尤为 ”|… LIrfETM. OLI 


突出 ,该 数据 不 适 于 基于 多 元 数据 的 草场 植被 盖 度 变化 OO 
趋势 研究 ,即便 是 经 过 校正 以 及 标准 化 处 理 的 SR 数 S 
据 , 反 演 结果 也 存在 约 +10% 的 不 确定 性 。 和 
4.4 讨论 | A f 
就 反 演 方法 而 言 ,以 往 类 似 的 研究 多 基于 相关 分 析 0 E 
线性 回归 以 及 多 项 式 模型 "* , 且 模 型 的 第 选 通 党 A 
仅仅 通过 P 值 以 及 决定 系数 R RIER, AR R Y 
测 结果 做 进一步 验证 。 从 本 文 的 线性 回归 结果 看 ,Ll 图 6 同时 段 不 同 数据 源 的 预测 结果 差异 


Fig.6 Difference in predicted values based on different dada 


数据 和 SR 数据 的 一 元 线性 模型 都 具有 显著 性 且 尺 水 arees in the same ix 

平 相当 ,在 以 MSAVI 作为 解释 变量 时 ,Ll 数据 的 拟 合 — SRufBTM_TM:SR 数据 基于 ET HB S] TM 传感器 随机 森林 反 
效果 甚至 要 优 于 SR 数据 ( 表 3) 。 但 从 图 3 中 可 以 清楚 — 演 结果 的 差异 ;SRufETM_OEI:S 志 数据 基于 ETM+ 传 感 器 与 OLI 传 
地 看 到 前 者 的 误差 要 远 远 大 于 后 者 。 可 见 ,P 值 以 及 — 感 器 随机 森林 反 演 结果 的 差异 ;ELfETM_TM:L1 数据 基于 ETM+ 
RR 并 未 帮助 研究 者 对 比 出 SR 数据 的 优越 性 。 更 为 重 传 感 带 与 TM 低 感 带 随 机 森林 反 演 结果 的 差异 ;LIrETM_OLI: LI 
要 的 是 .上述 模型 都 属于 参数 估计 类 , 若 不 对 其 基本 假 数据 基于 PTNL+ 传 感 器 与 OH 传感器 随机 森林 反 演 结果 的 差异 

设 进行 验证 ,就 无 法 保证 所 得 结论 的 可 靠 性 。 本 研究 显 

示 , 所 有 的 线性 模型 都 未 能 通过 方差 齐 性 和 残 差 正 态 性 检验 ， 而 遗憾 的 是 ,迄今 大 多 数 研 究 都 忽略 了 这 种 统 
计 学 的 基本 要 求 。 

需要 强调 的 是 ,除了 模型 本 二 之 外 ,数据 源 也 是 影响 预测 效果 的 重要 因素 。 由 图 5 中 基于 MODIS 数据 反 
演 得 到 的 变化 趋势 可 知 , 近 10 年 来 草场 盖 度 的 平均 值 总 的 变化 幅度 不 足 20% 左 右 ,而 2006 4E. L1 数据 反 演 所 
得 之 盖 度 平均 值 与 MODIS 数据 计算 结果 的 偏差 就 已 经 超过 了 20%。 该 问题 在 图 6 中 体现 得 更 加 突出 。 这 便 
意味 着 , 传 感 央 差 异 带 来 的 影响 甚至 可 能 超过 草场 变化 本 身 。 虽 然 本 研究 所 用 的 SR 数据 与 传统 研究 常用 的 
L1 数据 相 比 ,已 经 在 一 定 程度 是 减少 了 这 类 影响 ”” ,但 仍 未 将 其 完全 消除 。 因 此 ,在 涉及 长 时 间 序 列 草场 植 
被 变化 以 及 驱动 力 的 研究 中 ,对 这 种 影响 进行 量化 就 显得 尤为 必要 。 

本 文 的 局 限 性 主要 体现 在 以 下 元 个 方面 :首先 ,使 用 的 实地 监测 数据 为 Imxlnm 样 方 的 测量 值 , 而 遥感 影 
像 为 30mx30m 精度 3 如果 监测 点 周 玮 数 10m 范围 内 不 能 保持 均一 性 , 拟 合 结果 会 因此 受到 影响 ;其 次 ,本 研 
究 所 涉及 的 草场 种 类 众多 ,但 植被 指数 计算 涉及 的 参数 均 采用 了 USGS 网 站 提供 产品 指南 中 的 推荐 值 ,后 续 
研究 中 应 对 不 同类 型 草场 分 别 设 定 参数 ,以 提高 结果 的 可 靠 程度 ;再 次 ,本 研究 初步 估算 了 2005—2015 年 草 
场 羡 度 的 平均 值 ,今后 可 进一步 应 用 随机 森林 模型 分 析 草 场 植被 盖 度 的 空间 变化 特征 ;最 后 ,本 文 仅 初 步 研究 
了 传 感 希 差异 给 反 演 结果 造成 的 影响 ,如何 通 过 归 一 化 处 理 等 方法 减 小 这 种 差异 将 是 未 来 研究 中 需要 探索 的 


问题 。 


1) 本 文通 过 随机 森林 回归 方法 建立 了 基于 Landsat 系列 卫星 数据 的 草场 植被 盖 度 反 演 模型 ,并 应 用 该 模 
型 分 析 了 近 10 年 来 布尔 津 县 草场 盖 度 的 变化 趋势 。 

2) 通过 与 线性 回归 反 演 模型 的 对 比 可 知 ,随机 森林 回归 方法 不 但 能 规避 线性 回归 苛刻 的 假设 条 件 , 同 时 
可 超越 绝 大 多 数 线性 回归 模型 的 预测 能 

3) 模型 不 确定 性 方面 ,Landsat ETM+ 的 标准 数据 反 演 得 到 的 植被 盖 度 较 之 TM 和 OLI 数据 普遍 偏 小 ;地 
表 反 射 率 数据 虽然 可 以 大 幅 降低 Landsat 系列 不 同 传感器 对 反 演 结果 的 影响 ,但 反 演 得 到 的 植被 盖 度 仍 存在 
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(-10% ,11% ) 的 不 确定 性 。 
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